자연 언어 처리 (문단 편집)

=== [[기계 번역]] ===
Machine Translation. (MT)

언어 A로 되어있는 글을 언어 B로 자동으로 바꾸는 것을 연구하는 분야. 언어 계통적 유사성이 높은 언어간 번역([[영어]]-[[프랑스어]]/[[독일어]])은 잘 하는 반면, 계통적 유사성이 낮은 언어간 번역([[한국어]]-영어)은 아직 잘 하지 못한다. [[구글 번역]]의 예를 보면, 언어의 뉘앙스적인 면은 사용자들이 학습시키면 그럭저럭 하는 것 같다.

[[번역기]]를 사용해보면 영 시원찮다. 가장 근본적인 이유는 바로 현시점 [[인공지능]] 분야의 전반적인 한계점이다. 인간의 [[인지]]능력은 가장 기본적인 각 감각기관의 인지능력부터 모든 감각기관의 정보를 통합/취합하는 높은 단계의 인지까지 여러 단계로 나뉜다. 기계번역은 당연히 후자에 속하며 현시점 인공지능 기술은 전자를 겨우 해내가고 있는 상황이다. "사람수준"까지 끌어올린 분야는 사실상 영상 인식분야가 유일하며 그것도 이미지를 보여주고 누구 얼굴이냐/무슨 동물이냐/어떤 자동차냐 하는 수준이다. 바둑분야의 [[알파고]]를 떠올리기 십상이지만 알파고는 바둑판의 정보를 처리하는 인공신경망과 그 학습방법을 제외하면 체스머신 [[딥 블루]]와 크게 다르지 않다. 단순한 문제일수록 인간이 인지하는 방식이 아닌 단순 계산/탐색으로 해결 가능하며 체스/바둑도 이에 해당된다. 단 체스와 달리 바둑은 현재 판국의 우위를 단순 수식으로 표현하기 쉽지 않아 [[패턴인식]] 방식으로 접근한것 뿐이지 그걸 가지고 인공지능이 인간을 넘어섰다느니 하는 --설레발-- --과대망상-- 오판을 해서는 안된다. 인간의 언어는 인간이 인지하고 있는 세계에 대한 종합적인 정보축약이다. 시각을 한정으로 보았을때 명사는 인간의 시각중추가 인지한 각각의 공간적(spatial) 객체(사람, 동물, 자동차, 도로, 책상 등등)이고 동사는 이런 공간적 객체들의 시간적(temporal) 시퀀스이다. 문화권에 따라 언어는 어휘/문법 상 상당히 이질성을 나타내고 있으나 사실상 인간의 뇌속의 상위 표현은 동일한것이다. 인간의 뇌속에서의 번역과정은 한 언어를 시각/청각 정보로 인지하고 다시 다른 언어로 전환하는 과정이다.  이런 과정에 대한 모델링이 없이 단순히 수백/수천만 문장을 가지고 언어패턴/통계정보만 이용하여 번역을 하겠다고 하니 한계에 봉착할수 밖에 없다. 이로 인해 한 기계번역 경진대회(예를 들면 workshop for machine translation)에서는 2016년 부터 입력 문장외에 추가로 연관성이 있는 이미지를 제공하는 task가 생겼다. 서로 다른 종류의 데이터(예를 들면 이미지와 텍스트)를 취합하여 학습하는 기계학습 기법을 [[Multi-Modal Learning]]이라고 하며 기계번역분야의 새로운 방향으로 급부상하고 있으며 뉴럴 기계번역 방법론에 기반을 두고 있다.

저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,
기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.
이 동의는 철회할 수 없습니다.

자연 언어 처리 (문단 편집)

캡챠